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摘要 : 【目的 ] 探讨 人 工 智能 给 新 闻 传 媒 领 域 带 来 的 变革 和 创新 力量 。【 方法 】 分 析 新 闻 内 容 生 成 模式 的 变迁 和 
AIGC 爆发 的 原因 及 AIGC 的 实际 应 用 。【 结果 】 技 术 的 发 展 促进 了 AIGC 在 新 闻 传 媒 领 域 的 发 展 ，AIGC 给 新 闻 传 
媒 领 域 带 来 了 革命 性 的 力量 。【 结论 】 传统 媒体 需要 勇于 创新 ， 以 更 开放 、 积 极 的 态度 去 拥抱 以 AIGC 为 代表 的 人 


工 智 能 新 技术 。 


关键 词 : 人工 智 能 ; AIGC; 深度 学 习 ; 内 容 生成 ; 神经 网 络 


文章 编号 : 1671-0134 ( 2023 ) 05-076--05 


中 图 分 类 号 : G213 文献 标识 码 : A 


DOI: 10.19483/j.cnki.11—4653/n.2023.05.017 


本 文 著录 格式 : 杨 孔 威 . 以 AIGC 为 代表 的 人 工 智 能 在 传媒 领域 的 发 展 和 应 用 [有 ]. 中 国 传媒 科技 ，2023 ( 05): 


76 一 80. 


人 工 智能 对 于 人 们 来 说 并 不 陌生 。 

早 在 1997 年 ， 超 级 计算 机 “深蓝 ”打败 了 国际 象 
棋 大 师 加 里 ， 卡 斯 帕 罗 夫 ， 让 大 家 惊叹 于 计算 机 的 强 
大 。2017 年 AlphaGo 以 三 比 零 战胜 人 类 顶尖 棋 手 柯 洁 ， 
AlphaGo 超越 了 人 类 最 强 棋 手 的 能 力 ， 带 给 人 们 极 大 
的 震撼 。 

自 诞 生 以 来 ， 人 工 智能 发 展 共 经 历 了 三 次 浪潮 。 
1956 年 科学 界 提 出 了 人 工 智能 的 概念 ， 人 工 智能 之 父 
艾 伦 : 图 灵 提 出 了 著名 的 “图 灵 测 试 ”, 受 “ 图 灵 测 试 ” 
的 刺激 ， 全 球 范 围 内 出 现 了 第 一 波 人 工 乔 能 的 发 展 浪 
潮 ， 但 受 当 时 技术 的 限制 ， 人 工 智能 仍 处 于 科学 探索 
阶段 。20 世纪 80 年 代 ， 人 工 智 能 迎 来 了 第 二 次 发 展 
浪 泣 ， 科 学 家 们 利用 基于 概率 统计 模型 的 新 方法 ， 通 
过 分 析 语 音 .音素 .音节 之 间 的 对 应 关系 使 得 语音 识别 、 
机 融 翻 译 实现 了 新 的 突破 ,但 这 个 阶段 的 数据 量 训练 
有 限 ， 无 法 进行 有 效 扩展 导致 识别 率 较 低 ， 人 工 智 能 
还 不 具备 太 多 的 实用 价值 。 直 到 2006 年 ， 被 称 为 “ 神 
经 网 络 之 父 ” 的 Hinton 提出 了 深度 学 习 技 术 ， 人 工 智 
能 的 第 三 次 发 展 浪潮 从 此 开启 并 迎 来 了 跨越 式 的 发 展 。 

现 阶段 人 工 智 能 在 计算 机 视觉 、 语 音 识别 、 自 然 
语言 处 理 、 数 据 挖掘 等 领域 都 取得 了 突破 ， 也 不 断 地 
深入 新 的 创新 领域 ， 呈现 了 深度 学 习 、 跨 界 融 合 、 人 
机 协同 、 群 智 开 放 、 自 主 操控 等 新 特征 ， 对 新 闻 生 产 
模式 和 新 闻 编 辑 都 产生 了 重大 的 影响 。” 

1. 新 闻 传 媒 领 域 生成 模式 的 发 展 和 变迁 

在 传统 媒体 时 代 ， 以 报纸 、 电 视 为 代表 的 媒体 
的 生产 模式 是 专业 生产 内 容 即 PGC (Professionally 
Generated Content ) 。 进 入 互联 网 时 代 ， 一 些 知识 背景 


和 专业 资质 较 高 的 个 人 或 者 团体 按照 几乎 与 传统 媒体 
制作 节目 无 异 的 方式 制作 内 容 , 生 产 流程 比较 专业 化 ， 
制作 的 内 容 精良 、 质 量 可 探 性 较 强 。 优 酷 、 土 豆 是 最 
早 发 力 于 PGC 的 视频 网 站 ， 一 些 内 容 平 台 如 微 信 公众 
号 、 门 户 网 站 也 是 属于 PGC 的 生产 模式 。 

互联 网 的 普及 ，5G 技术 的 成 熟 促 进 了 移动 互联 网 
的 莲 动 发 展 ， 移 动 上 网 用 户 的 不 断 增加 带 来 了 社交 媒 
体 的 兴起 ， 互 动 性 的 常态 化 使 用 户 能 以 多 种 形式 在 网 
络 上 发 布 、 展 示 和 传播 由 用 户 个 人 创作 的 一 些 原创 性 
的 文字 、 图 片 或 音 视频 内 容 。 在 信息 大 爆炸 的 时 代 ， 
特别 是 伴随 着 以 个 性 化 为 主要 特点 的 Web2.0 概念 兴起 
和 拌 音 、 今 日 头条 等 App 的 火爆 ， 使 得 人 人 都 是 内 容 
生产 者 的 UGC (User Generated Content, 用 户 生 成 内 容 ) 
生产 模式 开始 冲击 传统 媒体 普遍 采用 的 PGC 内 容 生产 
模式 。 UGC 模式 的 出 现 使 得 社交 媒体 真正 成 为 一 种 “所 
有 人 对 所 有 人 的 传播 。”"™ 

早 在 人 工 智 能 的 第 二 次 发 展 浪潮 时 ， 科 学 家 们 就 
开始 探索 如 何 利 用 人 工 智 能 技术 来 生成 各 种 类 型 的 内 
容 ， 例 如 新 闻 、 音 乐 、 许 歌 等 。 这 一 阶段 的 人 工 智能 
还 属于 基于 规则 的 、 通 过 预先 设 定 基础 算法 来 生成 内 
容 的 一 种 简单 形式 。 随 着 AI 技术 的 不 断 迭 代 ， 新 型 的 
内 容 生 产 方 式 AIGC ( AI Generated Content， 人 工 智 能 
生成 内 容 ) 逐渐 从 概念 走向 了 落地 ， 并 以 超出 人 们 预 
期 的 速度 在 各 行业 特别 是 传媒 领域 创造 了 新 的 格局 和 
生态 ， 深 刻 改 变 了 行业 的 演进 模式 。 
2. AIGC 爆发 式 发 展 的 原因 
2.1 内 容 生 成 的 需求 

在 传播 的 实践 中 ， 内 容 生 产 永远 处 于 整个 传媒 产 
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业 链 和 价值 链 的 中 上 游 位 置 ， 掌 握 了 内 容 优 势 地 位 的 
媒体 ， 往 往 能 够 任 借 优质 内 容 在 媒体 竞争 中 立 于 不 败 
之 地 。 中 可 以 看 到 ， 在 PGC 模式 下 ， 内 容 生 产 依赖 于 
专业 化 团队 的 制作 ， 为 了 保障 生成 内 容 的 质量 ，PGC 
团队 需要 投入 大 量 的 人 力 、 物 力 资源 及 技术 成 本 ， 内 
容 生产 的 高 要 求 导 致 了 PGC 难以 满足 用 户 的 数量 和 履 
盖 面 需求 。UGC 模式 模糊 了 生产 者 与 消费 者 之 间 的 界 
限 ， 用 户 既 是 内 容 生产 者 也 是 产品 的 受众 和 消费 者 ， 
这 种 方式 降低 了 用 户 内 容 生 产 和 产品 的 准 入 门槛 ， 满 
足 了 用 户 个 性 化 和 多 样 性 需求 ， 使 得 内 容 产 品 得 以 爆 
发 式 地 增长 ， 大 大 提高 了 媒体 产业 链 的 繁荣 度 ， 但 由 
于 UGC 生产 者 专业 化 程度 参差 不 齐 ， 其 内 容 质量 不 可 
避免 地 受到 影响 。UGC 时 代 以 来 ，“ 新 闻 传 播 者 ”的 
角色 不 再 只 是 专业 新 闻 单 位 独 有 而 可 以 是 任何 人 ， 甚 
至 有 可 能 不 是 人 ， 如 此 带 来 新 闻 信 息 良 芒 不 齐 。 吓 

从 用 户 角度 而 言 ， 碎 片 时 间 的 阅读 习惯 也 让 人 们 
对 阅读 资源 的 需求 飞速 增长 。 在 “个 人 媒体 ”急剧 扩 
展 的 时 代 ， 用 户 通 过 智能 终端 从 网 络 实时 获取 信息 ， 
也 随时 随地 的 传送 和 分 享 信息 ， 信 息 发 布 的 形式 “ 千 
人 千 面 ”， 且 门槛 低 、 渠 道 多 ， 在 带 给 受众 更 高 的 参 
与 度 和 互动 性 的 同时 也 造成 了 海量 信息 的 淹没 ， 参 差 
不 齐 的 信息 海洋 给 用 户 增加 了 更 多 的 搜索 成 本 。 相 较 
于 传统 纸 媒 ,智能 终端 更 是 带 来 传统 纸 媒 单调 图 文 信 
息 所 无 法 充分 体现 的 视觉 和 听觉 效果 ， 人 们 需要 优质 
的 音 视频 内 容 带 来 立体 的 情感 体验 。 种 种 原因 使 人 们 
对 信息 内 容 的 丰富 性 、 多 样 性 、 专 业 性 提出 了 更 高 的 
要 求 ， 而 内 容 消费 的 强大 需求 与 内 容 供给 不 足 产生 的 
矛盾 依然 突出 ，PGC、UGC 也 逐渐 难以 匹配 内 容 需 求 
的 极速 扩展 ，AIGC 顺应 内 容 的 需求 得 到 快速 的 发 展 。 
2.2 技术 的 日 益 成 熟 

科技 创新 是 先进 生产 力 发 展 的 主要 动力 ， 技 术 也 
是 媒体 发 展 变革 的 第 一 生产 力 。AIGC 的 发 展 成 熟 离 不 
开 相 关 技 术 的 进步 。 一 般 而 言 ，AI 三 大 核心 要 素 分 别 
是 数据 、 算 力 和 算法 。 
2.2.1 海量 的 数据 基础 

海量 数据 是 深度 学 习 算 法 的 基础 。 深 度 学 习 算 法 
本 质 上 是 模拟 了 人 类 大 脑 的 运行 机 制 ， 而 人 类 如 果 要 
获取 相关 的 技能 ， 就 必须 经 过 不 断 地 实践 ，AI 也 是 如 
此 。AI 算 法 的 实现 过 程 需要 经 过 训练 和 推断 两 个 阶段 ， 
训练 阶段 需要 海量 的 数据 输入 ， 来 训练 出 一 个 复杂 的 
神经 网 络 模型 。 经 过 完善 的 训练 ， 这 个 神经 网 络 模 型 
可 以 快速 高 效 地 总 结 出 规律 , 并 从 新 的 数据 中 “推断 ” 
出 各 种 结论 。 得 益 于 多 层 神 经 网 络 ， 参 与 训练 的 数据 
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量 越 大 ， 模 型 覆盖 的 场景 越 多 ， 其 精准 度 就 越 高 ， 因 
此 模型 训练 数据 的 丰富 度 在 一 定 程度 上 决定 了 深度 学 
习 算 法 的 优 劣 。 

当今 大 数据 的 时 代 ， 网 络 、 摄 像 头 和 传感器 等 设 
备 无 时 无 刻 不 在 产生 各 种 文字 、 语 音 、 图 片 、 视 频 等 
数据 ， 据 IDC 的 报告 显示 ， 随 着 互联 网 新 技术 的 持 
续 推进 ，2021 年 全 球 数据 量 已 经 达到 82ZB， 预 计 到 
2025 年 将 达到 175 ZBY， 这 些 数据 都 可 成 为 AI 算法 充 
裕 的 训练 “饲料 ”。 伴 随 着 大 数据 技术 水 平 的 不 断 提 
升 ， 可 用 于 标注 的 AI 训练 数据 获得 成 本 也 得 到 降低 ， 
从 而 降低 AI 商业 化 的 成 本 ， 也 在 一 定 程度 上 加 速 推进 
AI 在 各 行业 的 普及 应 用 。 
2.2.2 算 力 能 力 的 不 断 提升 

算 力 是 数字 经 济 时 代 新 的 生产 力 ， 算 力 的 大 小 与 
数据 处 理 能 力 的 强 弱 息息相关 。 算 力 源 于 芯片 ， 作 为 
算 力 的 基础 和 核心 和 硬件， 芯片 的 发 展 程度 决定 着 AI 的 
进步 程度 。 

早期 ， 受 限于 芯片 的 处 理 能 力 ， 机 咒 无 法 处 理 复 
杂 的 程序 ， 人 工 智 能 只 能 完成 简单 的 任务 处 理 ， 计 算 
机 的 性 能 严重 制约 了 人 工 智 能 的 发 展 。 在 过 去 的 20 年 
里 ， 处 理 器 性 能 以 每 年 大 约 55% 的 速度 提升 ， 全 地界 
的 算 力 规模 保持 高 速 的 增长 态势 ， 算 力 蕊 片 的 快速 迭 
代 使 得 本 轮 人 工 智能 得 以 爆发 。 目 前 全 球 AI 算 力 主要 
是 以 GPU 芯片 为 主 ， 随 着 硬件 的 发 展 和 技术 的 不 断 更 
新 ， 专 用 的 AI ASIC 芯片 、 定 制 化 的 FPGA 芯片 等 有 
望 成 为 新 一 轮 AI 算 力 发 展 的 支撑 ， 异 构 技 术 架 构 、 专 
用 计算 架构 , 泛 在 协同 计算 架构 等 多 样 化 的 技术 架构 ， 
以 及 计算 技术 与 数学 、 物 理 等 多 学 科 交 叉 融 合 衍生 出 
的 量子 计算 、 存 算 一 体 等 计算 技术 的 突破 进展 ， 将 进 
一 步 推 动 着 算 力 的 加 速 提升 。 
2.2.3 算法 的 不 断 进 步 

20 世纪 40 年 代 ， 人 们 就 提出 了 神经 元 数学 模型 
的 概念 ，80 年 代 ，Hopfield 神经 网 络 和 BT 训练 算法 的 
提出 ， 进 一 步 推动 了 神经 网 络 的 研究 。 早 期 Hopfield 
神经 网 络 是 通过 抽象 人 脑 结构 和 外 界 刺激 响应 机 制 ， 
探索 模拟 人 脑 神经 系统 的 学 习 、 联 想 、 记 忆 和 模式 识 
别 等 功能 ， 从 而 进行 逻辑 操作 的 数学 模型 。 外 但 早期 
神经 元 网 络 只 能 解决 单一 的 问题 ， 复 杂 数 据 的 处 理 受 
到 限制 ， 无 法 穷 举 复杂 的 情景 ， 当 网 络 规模 和 数据 量 
积累 到 一 定 程度 后 ， 即 使 再 投入 更 多 的 数据 ， 准 确 率 
依然 无 法 提升 ， 实 际 应 用 价值 有 限 。 

2006 年 ，Hinton 等 人 提出 了 神经 网 络 深度 学 习 
(Deep Learning ) 算法 ,将 人 类 从 复杂 的 算法 归纳 中 
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解放 了 出 来 ,开启 了 机 器 学 习 的 新 领域 和 第 三 次 人 工 
智能 的 发 展 浪 潮 。 与 传统 的 机 磊 学 习 算 法 比较 ， Deep 
Learning 算法 的 特点 在 于 具有 优异 的 特征 学 习 能 
不 需要 人 工 去 提取 规则 特征 ， 机 融 能 够 实现 特征 的 自 
动 提取 ， 将 复杂 的 归纳 算法 留 由 机 器 去 完成 ， 同 时 ， 
随 着 数据 规模 的 增加 ， 算 法 准确 性 也 在 不 断 提高 ， 弥 
补 了 传统 BP 神经 网 络 准确 率 不 高 的 缺陷。 相关 数据 
显示 ， 在 引入 深度 学 习 之 前 ， 语 音 识别 的 准确 率 连 续 
三 年 稳定 在 76.4%， 而 2018 年 阿里 巴巴 达 摩 院 语音 识 
别 团 队 利 用 深度 学 习 技术 推出 的 新 一 代 语 音 识别 模型 
DFSMN 将 全 球 语音 识别 准确 率 纪录 提高 至 96.04%。" 

人 工 智能 领域 顶级 专家 吴 恩 达 提 到 : 发 展 人 工 智 
能 就 像 用 火箭 发 射 卫星 ， 需 要 强大 的 引擎 和 足够 的 燃 
料 ， 算 法 模型 就 是 其 引擎 ， 高 性 能 的 算 力 是 打造 引擎 
的 工具 ,海量 的 数据 就 是 引擎 的 燃料 数据 “算法 “ 算 
力 ” 是 人 工 智能 最 重要 的 三 大 要 素 ， 它 们 之 间 相 互 促 
进 和 相互 支撑 ， 最 终 促成 了 人 工 智 能 技术 的 应 用 和 价 
值 创造 。™ 

目前 AI 被 广泛 认为 是 人 类 历史 上 第 四 次 工业 革 
， 美 国 、 中 国 等 科技 大 国 均 将 其 提升 至 顶层 战略 高 
,在 技术 的 促进 、 政 策 的 加 持 和 资本 的 催化 下 ,，“ 弱 
工 智能 ”的 应 用 已 经 快速 渗透 到 各 行业 中 ，AIGC 也 
进入 了 新 闻 传 媒 领域 。 
3. AIGC 在 新 闻 领 域 的 应 用 

多 模 态 的 预 训 练 模型 给 AIGC 带 来 了 多 样 化 的 内 
容 生 产能 力 ， 使 其 不 仅 能 够 拥有 文字 、 图 片 、 音 频 和 
视频 等 基本 的 内 容 生成 模式 ， 还 可 以 对 文字 、 图 片 、 
视频 等 相互 之 间 进 行 跨 模 态 的 内 容 生 产 ， 给 新 闻 传 媒 
行业 带 来 了 一 轮 新 的 生产 革命 。 
3.1 AIGC+ 文本 生成 

作为 AIGC 最 早 发 展 的 技术 ,文本 生成 已 经 在 新 
闻 报 道 领域 得 到 广泛 的 应 用 。 早 在 2014 年 ，《 洛 杉 矶 
时 报 》 就 使 用 地 震 新 闻 自 动 生成 系统 播报 了 加 州 地 震 
的 第 一 条 新 闻 报 道 , 给 新 闻 传媒 行业 带 来 了 革新 力量 。 
近 几 年 ， 随 着 人 工 智 能 技术 的 不 断 发 展 和 成 熟 ， 国 内 
外 媒体 都 开始 将 其 运用 到 新 闻 生 产 和 传播 的 产业 链 中 。 
美 联 社 自 2018 年 开始 就 用 生成 式 AI 工具 Wordsmith 
自动 生成 体育 新 闻 和 财经 报告 ， 目 前 至 少 已 经 实现 
50000 篇 文章 的 自动 化 撰写 。 路 透 社 在 2018 年 启用 了 
一 款 名 为 Lynx Lnsight Service 的 AI 新 闻 撰 稿 工 具 ， 以 
帮助 新 闻 记者 分 析 数 据 、 提 出 故事 构想 、 自 动 生成 有 
关 金 融 市 场 和 企业 收益 的 报告 。 新 华 社 于 2015 年 就 研 
发 了 一 款 名 为 “ 快 笔 小 新 ”的 新 闻 机 器 人 ， 通 过 数据 
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采集 、 数 据 加 工 、 自 动 写 稿 、 编 辑 签 发 从 而 实现 提高 
新 闻 的 制作 效率 。 人 工 智 能 专家 匡 恩 达 表 示 : “AIGC 
可 以 帮助 人 类 创造 更 多 高 质量 的 内 容 ， 并 且 可 以 帮助 
人 们 更 好 地 理解 复杂 的 数据 和 信息 。” 国 内 外 大 型 媒 
体 机 构 都 开始 使 用 AIGC 来 提高 新 闻 生产 制作 的 速度 
和 效率 ，AIGC 参与 生产 的 内 容 也 日 益 渗透 到 人 们 生活 
的 方方面面 ， 为 读者 提供 了 更 加 个 性 化 的 新 闻 体 验 。 
3.2 AIGC+ 视频 剪辑 
随 着 5G 技术 的 发 展 和 智能 终端 的 普及 ， 受众 “ 碎 
片 化 ”内 容 消 费 习 惯 的 形成 使 得 短视 频 得 以 快速 发 展 
并 成 为 当今 各 个 内 容 消 费 领域 的 主流 ,但 内 容 形式 模 
式 化 和 产品 同 质 化 也 使 得 生产 者 面临 着 激烈 的 竞争 和 
挑战 。 如 何 提高 内 容 生产 的 效率 ， 快 速 推出 受众 欢迎 
且 高 质量 的 内 容 成 为 各 大 媒体 内 容 创作 者 的 关注 重点 。 
AIGC 技术 与 短视 频 内 容 创作 的 结合 带 来 的 便利 和 优势 
成 为 问题 的 最 佳 解 决 方式 ， 通 过 AIGC 技术 的 应 用 ， 
可 以 更 好 地 提高 视频 的 质量 及 创作 效率 ， 有 效 地 区 分 
目标 受众 ， 并 且 更 加 高 效 地 将 相关 的 作品 推送 出 去 。 
AIGC 目前 在 视频 领域 的 应 用 主要 集中 在 视频 内 容 
属性 的 编辑 和 内 容 生产 的 自动 剪辑 等 功能 上 。 对 于 视 
频 内 容 编辑 ，AIGC 可 以 实现 自动 画 质 修复 、 人 敏感 人 物 
识别 、 主 题 自 动 跟 踪 剪 辑 、 画 面 特 效 、 自 动 美 颜 等 ; 
对 于 视频 自动 剪辑 ，AIGC 可 以 基于 视频 中 的 画面 、 声 
音 等 多 模 态 信息 的 特征 进行 解析 ， 按 照相 应 的 语义 限 
定 进行 检测 ， 对 满足 条 件 的 片段 进行 剪辑 合成 ， 从 而 
实现 智能 提取 、 自 动 制作 、 全 景 直播 拆 条 等 功能 。 
早 在 2017 年 ， 新 华 社 和 新 华 智 云 立足 新 闻 内 容 生 
产 自 动 化 场景 ， 联 合 推出 了 名 为 “媒体 大 脑 ” 的 人 工 
日 


精彩 片段 快速 拆 条 ， 生 成 内 容 一 键 快速 发 布 到 各 大 平 
台 , 简化 了 流程 也 为 编辑 节省 时 间 实 现 了 “快速 传播 ” 
的 功能 。 

中 央 广 播 电 视 总 台 在 北京 2022 年 冬 奥 会 上 采用 
AI 智能 自动 化 生产 剪辑 系统 ， 利 用 海量 赛事 资源 ， 对 
赛事 关键 时 刻 实现 快速 自动 剪辑 ， 规 模 化 地 自动 生成 
并 发 布 短 视频 内 容 ， 有 效 地 节省 人 力 成 本 ,将 编辑 从 
繁琐 的 人 工 剪辑 工作 中 解放 出 来 。AIGC 的 剪辑 能 力 让 
中 央 广 播 电视 总 台 在 冬 奥 视 频 报 道中 实现 了 速度 与 质 
量 的 比拼 优势 。 

AIGC 在 体育 媒体 视频 内 容 生产 领域 得 到 广泛 应 用 
是 大 势 所 趋 ， 在 大 幅 提升 内 容 生产 效率 的 同时 还 将 向 
内 容 多 元 化 方向 进一步 延伸 ， 创 建 系统 化 、 结 构 化 的 
精品 内 容 ， 满 足 受 众 对 内 容 质量 和 数量 的 双重 刚性 需 
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求 。 
3.3 AIGC+ 数字 人 

AIGC 数字 人 在 本 质 上 也 是 建立 了 人 与 虚拟 世界 的 
链接 和 交互 ， 同 时 解放 了 真人 的 劳动 力 。AI 数 字 人 可 
以 很 好 地 根据 真实 人 的 外 貌 、 动 作 、 表 情 、 声 音 等 特 
点 进行 模拟 以 达到 惟妙惟肖 的 程度 ， 并 且 可 以 通过 自 
然 语言 模型 来 模拟 人 类 思维 和 行为 特征 。 由 于 AIGC 
数字 人 是 通过 计算 机 创建 的 ， 它 们 不 会 生老病死 ， 也 
不 受 时 间 和 环境 的 影响 , 能 够 成 为 不 眠 不 休 的 “劳模 ”。 

通过 自然 语言 处 理 、 语 音 合成 和 语音 识别 技术 的 
加 持 ， 在 播音 主持 领域 ，AIGC 数字 人 能 够 像 真人 主播 
一 样 提供 出 色 的 播音 主持 工作 ， 还 能 24 小 时 在 线 ， 不 
仅 能 够 根据 场景 节目 创建 不 同 的 数字 主持 人 ， 也 可 以 
模仿 某 个 受用 户 喜 爱 的 主持 创建 不 同 的 分 身 , “扮演 ” 
不 同 栏目 的 主持 人 、 新 闻 主 播 等 角色 , 分 别 讲解 科技 、 
文化 、 历 史 、 地 理 、 美 食 等 不 同 领域 的 知识 ，“ 他 们 ” 
风度 翩翩 、 学 富 五 车 , 不 仅 拥有 了 全 面 、 广 泛 的 知识 ， 
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数字 人 也 将 成 为 人 类 链接 数字 世界 的 纽带 ， 加 速 元 宇 
宙 等 产业 的 持续 演进 和 多 元 化 发 展 ， 丰 富 数 字 化 应 用 
场景 并 推动 数字 经 济 产 业 的 发 展 。IDC 在 《中 国 AI 
数字 人 市 场 现状 与 机 会 分 析 ，2022》 报 告 中 预计 ， 到 
2026 年 中 国 AI 数字 人 市 场 规模 将 达到 102.4 亿 元 。™" 
3.4 AIGC+ 声音 应 用 

在 新 闻 媒 体 的 传播 过 程 中 ， 声 音 以 其 独特 的 吸引 
力 ， 成 为 不 可 或 缺 的 “元 素 ”， 专 业 的 配音 传达 了 新 
闻 令 述 者 的 情感 ， 提 升 了 观众 的 共 情 和 体验 感 。 然 而 
音频 制作 本 身 也 存在 一 些 难 点 ， 例 如 传统 节目 中 由 创 
作者 制作 的 音频 不 仅 创 作 形 式 单 一 ， 而 且 对 配音 员 要 
求 高 , 耗 时 长 , 配音 成 本 高 。 随 着 人 工 智 能 技术 的 发 展 ， 
AI 语音 识别 、 语 音 合成 等 技术 逐步 在 新 闻 媒 体 领域 得 
到 应 用 。 早 期 的 语音 生成 系统 因为 缺乏 表达 导 辑 推理 
和 因果 关系 的 能 力 ， 缺 乏 连续 语音 的 韵律 ， 机 械 感 重 
让 人 感觉 单调 不 真实 ; 近年 来 ， 随 着 数字 信号 处 理 技 
术 的 飞速 发 展 ,语音 合成 技术 也 取得 了 相当 大 的 进步 ， 


如 果 接 入 对 话 模 型 ( ChatGPT ) 数字 人 还 可 以 实现 面 
对 面 的 交流 ， 回 答 观 众 提出 的 各 类 问题 ， 让 人 机 交互 
更 加 真实 和 惟妙惟肖 。 人 机 协同 不 仅仅 表现 在 信息 处 
理 流程 方面 ， 更 多 表现 的 是 在 身心 一 体 的 深度 情感 沟 
通 层面 上 。 包 

新 华 社 早 在 2020 年 就 联合 搜狗 公司 推出 了 全 球 首 
个 3D AI 合成 主播 “新 小 微 ”， 其 采用 超 写 实 3D 数字 
人 建 模 、 实 时 面部 动作 生成 及 驱动 、 多 模 态 识别 及 生 
成 、 迁 移 学 习 等 多 项 人 工 智能 前 沿 技术 ， 根 据 输入 的 
文本 机 器 可 以 自动 生成 相似 度 极 高 的 数字 人 视频 内 容 ， 
同时 在 播报 过 程 中 能 够 根据 语义 产生 相对 应 的 面部 表 
情 和 上 肢体 语言 。"" 

新 华 智 云 2019 年 便 开始 试 水 数字 人 ， 开 创 了 新 闻 
领域 实时 音频 与 AI 真人 形象 合成 的 先河 ， 基 于 深度 学 
习 模 型 、 动 作 模拟 、 情 感 模 拟 等 科技 ，AI 通过 采集 几 分 
钟 的 真人 视频 进行 几 小 时 的 训练 后 ， 生 成 形象 逼真 、 表 
情 到 位 、 口 型 匹配 的 数字 人 。 在 2020 年 的 地 方 两 会 报 
道中 , 就 有 7 省 的 两 会 报道 使 用 了 新 华 智 云 的 虚拟 主播 。 

2023 年 全 国 两 会 期 间 ， 百 度 运 用 了 可 交互 式 超 写 
实数 字 人 与 AIGC 技术 ， 将 数字 人 与 人 工 智 能 生成 内 
容 相 结合 ， 以 科技 感 十 足 的 人 机 交互 式 对 话 方式 ， 向 
公众 在 线 解 读 最 高 人 民法 院 工 作 报告 。 

随 着 技术 的 成 熟 ， 依 托 AI 技术 驱动 的 数字 人 将 成 
为 未 来 数字 人 市 场 的 主流 。 越 来 越 接 近 真 人 外 形 的 数 
字 人 ， 将 给 各 行 各 业 特 别 是 新 闻 传 媒 行业 的 受众 提供 
更 亲切 、 自 然 、 高 效 的 服务 体验 。AI 浪潮 之 下 ，AIGC 


高 度 拟 人 、 流 畅 自 然 的 语音 合成 服务 、 语 音 播报 、 仿 
真 真人 配音 也 在 新 闻 媒体 中 得 到 广泛 应 用 并 提高 了 音 
频 内 容 的 用 户 体验 感 。 

AIGC 也 开始 在 语音 克隆 、 生 成 虚拟 人 的 定制 声音 
等 领域 得 到 应 用 ， 并 且 交 互 性 、 实 时 性 进一步 增强 。 
生成 的 音频 内 容 有 情绪 、 有 温度 ， 或 深层 雄厚 ， 或 俏 
皮 可 爱 ， 或 销 销 有 力 ， 或 绵 柔 动人 。 

科大 讯 飞 2023 年 新 发 布 了 一 条 关于 节气 《雨水 》 
的 视频 ， 深 沉 厚 重 的 男 低 音 自 带 质感 ， 这 段 配 音 由 科 
大 讯 飞 的 SMART-TTS 系统 合成 ， 其 语气 的 变化 、 语 
名 的 停顿 、 声 音 的 细腻 程度 都 和 真人 所 差 无 几 。 喜 马 
拉 雅 利用 AIGC 理解 文本 的 语 境 ， 选 择 合适 的 音色 ， 
根据 文本 的 情绪 随时 转换 声音 ， 创 造 了 多 情感 、 多 风 
格 的 声音 模型 运用 在 新 闻 、 小 说 、 财 经 等 不 同类 型 内 
容 的 制作 中 。 

2022 年 11 月 1 日 ， 新 华 社 利 用 AIGC 能 人 
工 智能 演唱 及 智能 视频 创作 ， 发 布 了 数字 记者 、 全 球 
首位 数字 航天 员 小 净 的 单 曲 MV《 升 》， 此 次 发 布 的 
AI MV《 升 》 由 新 华 社 媒体 融合 生产 技术 与 系统 国家 
重点 实验 室 联合 腾讯 音乐 娱乐 集团 出 品 ， 歌 曲 演唱 体 
现 了 高 度 拟 人 化 的 合成 语音 技术 ， 生 成 的 语音 甜美 且 
深 富 情 感 。"" 

AIGC 与 智能 语音 技术 的 深度 结合 ， 以 及 应 用 场景 
在 新 闻 媒 体 行业 中 的 创新 落地 ， 有 望 进一步 推动 智能 
语音 产业 市 场 的 发 展 。 

3.5 AIGC+ 视频 生成 


To 


80 | 新 媒体 研究 


202310.00089v1 


chinaXiv 


AI 生成 配音 可 以 说 是 当下 各 种 媒体 行业 特别 是 短 
视频 内 容 创 作者 最 为 依赖 的 工具 ， 但 随 着 AIGC 的 跨 
越 式 发 展 ， 传 统 的 配音 已 经 满足 不 了 AIGC 的 “大 放 
异彩 ”之 心 了 。 从 技术 的 发 展 可 以 看 出 , 在 语言 大 模型 、 
图 像 大 模型 之 后 ， 基 于 深度 学 习 的 生成 扩散 模型 和 多 
模 态 预 训练 大 模型 已 经 成 为 新 的 趋势 ， 视 频 生 成 就 是 
其 中 具有 代表 性 的 应 用 领域 。 

2022 年 Meta 公司 推出 了 名 为 Make-A-Video 的 文 
本 生成 模型 ， 实 现 了 通过 文本 直接 “书写 ”视频 的 能 
力 ， 其 AI 模型 还 能 实现 将 两 张 静 态 图 像 转 成 视频 ， 或 
者 根据 两 张 图片 生 成 一 段 连续 视频 ， 以 及 基于 一 段 原 
视频 生成 新 视频 的 能 力 ， 生 成 的 视频 具有 丰富 的 审美 
和 艺术 风格 。 同 样 谷 歌 公司 也 推出 名 为 Phenaki 的 AI 
模型 ， 只 需 向 其 提供 一 段 剧本 提示 词 ， 这 个 文本 转 视 
频 (Text-to-Video ) 模型 就 能 生成 一 段 长 达 两 分 钟 且 
颇具 故事 性 的 视频 内 容 。 

国内 AI 巨头 百度 也 不 甘 落 后 ， 早 在 2019 年 就 已 
开始 积累 AI 预 训 练 模型 技术 ， 并 把 文 心 大 模型 的 能 
也 运用 到 了 智能 视频 合成 平台 VidPress 中 ， 实 现 图 文 
自动 转换 视频 的 功能 ， 即 把 文字 分 析 与 摘要 、 媒 体 素 
材 收集 、 素 材 智能 化 处 理 、 音 视频 对 齐 ， 以 及 视频 前 
辑 这 5 个 步骤 实现 自动 化 ， 其 中 使 用 了 大 量 的 自然 语 
言 处 理 技术 对 图 文 内 容 进 行 分 析 ， 这 些 都 是 基于 文 心 
大 规模 训练 实现 的 。 

2022 年 ， 新 华 社 与 百度 文 心 一 格 联 合 推 出 了 一 支 
AIGC 视频 《AI 描绘 天 宫 盛 实 》， 视 频 画 面 全 部 由 AI 
自动 生成 ,通过 一 幅 幅 具备 东方 意象 的 恢宏 绚丽 画作 ， 
回顾 了 30 年 来 中 国 载 人 航天 的 辉煌 历程 。 

在 传媒 、 文 化 娱乐 、 教 育 等 诸多 领域 ， 生 产 创 作 
视频 内 容 都 是 当下 吸引 受众 眼球 最 重要 的 方式 ， 越 来 
越 多 的 人 通过 制作 创意 短视 频 内 容 进 行 推 广 从 而 实现 
商业 化 变现 ， 这 些 都 将 促使 各 行业 对 基于 AIGC 的 视 
频 生 成 内 容 有 强烈 的 需求 ， 在 视频 成 为 信息 主要 表达 
载体 的 当下 ， 无 论 在 新 闻 节目 、 短 视频 、 直 播 ， 还 是 
影视 等 领域 ，AI 视频 内 容 生成 都 将 成 为 AIGC 的 主要 
发 展 方向 。 当 视频 生成 质量 提高 到 专业 水 平时 ，AIGC 
也 将 打开 更 多 内 容 创作 的 想象 空间 ， 更 大 规模 地 服务 
受众 ， 满 足 现代 人 的 生活 需求 。 
结语 

伴随 人 工 智 能 等 新 技术 的 不 断 完 善 ， 媒 体 已 经 进 
人 一 个 全 新 的 智 媒 时 代 ， 媒 体 智能 化 正在 重 塑 传媒 业 
的 原 有 生态 。" 正如 比尔 盖 蒋 所 说 ，AIGC 这 种 变革 性 
技术 ， 其 影响 力 不 亚 于 PC 或 互联 网 诞生 。AIGC 在 科 
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技 界 掀起 的 惊涛骇浪 正在 向 各 个 领域 延伸 ， 给 人 们 的 
工作 、 生 活 模式 帝 来 巨大 变化 。 它 的 出 现 给 包括 新 闻 
媒体 在 内 的 各 行 各 业 带 来 了 新 的 挑战 和 机 遇 ， 也 促使 
人 们 必须 以 更 加 开放 、 积 极 的 态度 去 适应 技术 的 不 断 
创新 和 发 展 , 不 断 提升 自身 的 创新 能 力 和 核心 苋 争 力 ， 
如 此 才能 在 这 股 科技 的 大 浪 淘 沙 中 立 于 优势 地 位 。 印 
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